热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ICCV2019|可变形曲面跟踪,亮风台新出基于图匹配的方法

点击我爱计算机视觉标星,更快获取CVML新技术今天跟大家分享一篇ICCV2019跟踪的论文:DeformableSurfaceTrackingbyGra

点击我爱计算机视觉标星,更快获取CVML新技术


今天跟大家分享一篇ICCV 2019 跟踪的论文:Deformable Surface Tracking by Graph Matching,国内AR(增强现实)公司亮风台提出使用基于图匹配的可变形表面跟踪算法,能够充分探索可变形表面的结构信息,显著提高跟踪性能。

该文作者信息:

作者来自亮风台公司、北京交通大学、Stony Brook University。

所提出的方法通过图结构之间的成对投影误差解决了特征对应和形状恢复问题,并采用软匹配松弛来提高计算效率。

与现有先进算法进行广泛比较后,实验结果表明,新方法可以对不同类型纹理的曲面实现稳健的跟踪结果,并且在跟踪精度和计算效率方面一般优于其它算法。

新提出的基于图的可变形表面目标的跟踪算法,主要贡献在三个方面:

  1. 通过软匹配松弛和精心设计的候选匹配滤波策略,将图模型和图匹配引入到可变形表面跟踪中; 

  2. 设计统一的优化框架,探索局部外观,空间关系和变形模型的全部信息,以获得准确的形状重建; 

  3. 构造了一个带有注释的新的真实世界数据集,用于在不同类型的纹理的情景中评估可变形表面跟踪算法。 

以下为论文的详解:

1. 综述

该文解决了跟踪具有已知初始3D形状(即模板)的通用可变形表面目标以及在单眼透视投影下在视频序列中恢复其3D形状的问题。模板可以被提前手动提供,或者使用从运动中恢复形状的方法从视频序列的数帧中计算模板。

与通常分别处理特征对应关系,去除异常值和形状重建的传统方法不同,该文将这些过程集成到一个统一的基于图的框架中,并提出迭代地解决求解对应关系和求解变形的优化问题。

考虑到计算效率,该文将传统图匹配问题中的强匹配约束放宽到松匹配约束。这种松匹配约束使该算法能够保持更多匹配细节,从而产生更精确的形状,并且通过在软匹配约束下开发的新颖匹配算法也极大地提高了计算效率。

伴随着精心设计的候选匹配过滤策略,该文的基于图的方法能够在几秒内处理数千个点,这比传统的基于图的算法快得多。

为了进行全面评估,该文将提出的方法与几个最近提出的方法在两个数据集上进行比较:

一个是提供的跟踪存在遮挡的表面(TSO)基准,包括存在目标被遮挡现象的两个视频序列;

另一个是新收集的数据集,包括使用不同表面在显著形变的条件下记录的11个视频序列,其中这些目标具有丰富,不明显或重复的纹理。 

实验结果表明,该文的方法可以为所有视频序列提供最佳或近乎最佳的跟踪结果。在计算效率方面,该文的方法在两个数据集上的表现也通常优于参与比较的算法。

(CV君:由于微信不支持公式插入,故以下内容使用图片展示)

4. 实验

4.1. 新收集的数据集

最近,几个数据集被提供来用于评估可变形表面目标的跟踪。但是,它们中的大多数缺少带注释的真实结果(groundtruth)网格顶点。

而且,这些数据集是使用非常有限的表面类型的目标收集的,不足以评估可变形表面目标跟踪算法的有效性。

为了全面评估所提出的算法与基准算法的比较,该文创建了一个新的数据集用于可变形表面跟踪,称为可变形表面跟踪(DeSurT)。

使用Kinect相机收集此数据集,以评估各种变形和不同光照条件下的跟踪性能。它包含11个视频流和3,361个帧,显示几种不同类型表面的各种变形,包括七种不同内容的打印图像(分别是校园,砖,布,鹅卵石,景色,石头和日落),两个报纸和两个靠垫。

如图所示,这些表面大致分为三类:

(1)纹理良好的表面,包括校园,鹅卵石,景色,报纸1,报纸2和坐垫1;

(2)重复纹理表面,包括砖,布和垫子2;

(3)弱纹理表面,包括石头和日落。

 

为了评估重建精度,该文使用Kinect点云来构建真实网格,并计算从重建网格到真实网格中顶点到顶点的平均距离

因此,除了每个帧的深度信息之外,所有视频都在每帧中有手动标注的真实网格顶点(打印图片和报纸中使用130个顶点标注,坐垫用121个顶点标注)。

为了测试所提出的算法对遮挡的鲁棒性,该文还报告了算法在公共数据集(跟踪具有遮挡的表面(TSO)上的跟踪结果,这个数据集包括两个分别有着纹理良好和纹理不良的可变形表面目标的视频流,总共394个帧,并且数据集中存在人为和现实的遮挡。

4.2 结果比较与分析

在本节中,该文报告了所提算法与几种最先进的基线算法的比较结果,包括DIR,LM和LLS:

LM采用SIFT匹配进行特征对应,然后进行迭代异常值拒绝步骤,然后通过求解线性系统重建形状,该线性系统是使用扩展的拉普拉斯形式从退化的线性系统转换而来。

LLS仅关注形状重建步骤,并将关键点对应关系作为输入。在该文的实验中,(在异常值拒绝之后)使用从LM派生的关键点对应作为LLS的输入。

DIR是一种基于像素的方法,采用密集模板对齐进行形状重建。它在很大程度上取决于形状的初始估计,该文将其初始化为上一帧的解。

文中固定并分别公布了N=1000和N=2000两组实验结果。

1. 平均跟踪误差(mm)

2. 平均计算时间(s)

如表1所示,该文的算法对于具有丰富,弱或重复纹理的不同类型的表面是鲁棒的,并且即使在从每个表面提取相对较少的关键点(N=1000)以构建对应关系时也显着地优于所有基线算法。

对于遮挡表面(TSO数据集),DIR在精心设计的遮挡检测策略的帮助下实现了最佳跟踪结果。

有趣的是,在没有任何指定的遮挡表面过程的情况下,该文的算法在TSO数据集上达到了与DIR相当的结果,并且一般优于LM和LLS。当将N上升到2000时,该文的算法的跟踪精度在两个数据集上都得到了显着的改善。

考虑到计算时间(表2),DIR在两个数据集上都是最耗时的。该文的算法在N=1000时在两个数据集上击败其他算法。

当将关键点的数量增加到2000时,在TSO数据集上仍然是最有效的,但在DeSurT数据集上比LM慢。

图3至图6表明了由被比较算法提供的各种类型表面跟踪的几个代表性样本。对于结构良好的表面(图3),所有算法都能够提供合理的跟踪结果,但该文的算法可以更好地处理细节。

如图4和图5所示,所有比较的基线算法都受到弱纹理和重复纹理化表面的影响,但该文的算法能够在帧间提供准确的跟踪结果。

此外,该文算法以及DIR对于遮挡是稳健的(图6),而LM和LLS在存在一定程度的遮挡时可能无法跟踪到对象。

 

论文地址:

https://www3.cs.stonybrook.edu/~hling/publication/deformable%20surface-19.pdf 


数据链接:

https://www3.cs.stonybrook.edu/~hling/data/DeSurT.rar (~2G)

因为之前工作相关,对亮风台这家公司还是比较了解的。亮风台是国内为数不多的持续深耕AR底层技术的公司,之前52CV也报道过他们的技术。

他们围绕AR开源了不少算法:包括图匹配算法(PAMI 2018a),2D AR跟踪算法(PAMI 2018b),投影补偿算法(CVPR 2019),单目标跟踪算法(ICCV 2017、CVPR2019)等等。

相信研究跟踪的同学肯定也了解一些他们曾经发布的数据集,TC-128,POT-210,LaSOT。其中TC-128是国际上第一个彩色跟踪评测集,POT-128是目前国际上最大的AR跟踪数据评测集,LaSOT是目前国际上最大的单目标跟踪评测集。


视觉跟踪交流群

关注最新最前沿的目标跟踪、AR跟踪、曲面跟踪技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:跟踪)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉



推荐阅读
  • 本文介绍了几种常用的图像相似度对比方法,包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点,适用于不同的应用场景。 ... [详细]
  • MATLAB实现Sobel边缘检测算法
    图像边缘是指图像中灰度值发生显著变化的区域。Sobel算子是一种常用的边缘检测方法,通过计算图像灰度值的梯度来检测边缘。本文介绍了Sobel算子的基本原理,并提供了基于MATLAB的实现代码。 ... [详细]
  • 本文详细介绍了如何使用OpenSSL自建CA证书的步骤,包括准备工作、生成CA证书、生成服务器待签证书以及证书签名等过程。 ... [详细]
  • 对于众多创业公司而言,选择小程序或小视频的发展方向至关重要。本文将深入分析小程序和小视频的特点、优势及局限,帮助创业者做出更明智的选择。 ... [详细]
  • 微信公众号推送模板40036问题
    返回码错误码描述说明40001invalidcredential不合法的调用凭证40002invalidgrant_type不合法的grant_type40003invalidop ... [详细]
  • 本文通过思维导图的形式,深入解析了大型网站技术架构的核心原理与实际案例。首先,探讨了大型网站架构的演化过程,从单体应用到分布式系统的转变,以及各阶段的关键技术和挑战。接着,详细分析了常见的大型网站架构模式,包括负载均衡、缓存机制、数据库设计等,并结合具体案例进行说明。这些内容不仅有助于理解大型网站的技术实现,还能为实际项目提供宝贵的参考。 ... [详细]
  • 利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Exce ... [详细]
  • 结城浩(1963年7月出生),日本资深程序员和技术作家,居住在东京武藏野市。他开发了著名的YukiWiki软件,并在杂志上发表了大量程序入门文章和技术翻译作品。结城浩著有30多本关于编程和数学的书籍,其中许多被翻译成英文和韩文。 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 在多线程并发环境中,普通变量的操作往往是线程不安全的。本文通过一个简单的例子,展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]
  • MySQL 5.7 学习指南:SQLyog 中的主键、列属性和数据类型
    本文介绍了 MySQL 5.7 中主键(Primary Key)和自增(Auto-Increment)的概念,以及如何在 SQLyog 中设置这些属性。同时,还探讨了数据类型的分类和选择,以及列属性的设置方法。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 【实例简介】本文详细介绍了如何在PHP中实现微信支付的退款功能,并提供了订单创建类的完整代码及调用示例。在配置过程中,需确保正确设置相关参数,特别是证书路径应根据项目实际情况进行调整。为了保证系统的安全性,存放证书的目录需要设置为可读权限。值得注意的是,普通支付操作无需证书,但在执行退款操作时必须提供证书。此外,本文还对常见的错误处理和调试技巧进行了说明,帮助开发者快速定位和解决问题。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 题目解析给定 n 个人和 n 种书籍,每个人都有一个包含自己喜好的书籍列表。目标是计算出满足以下条件的分配方案数量:1. 每个人都必须获得他们喜欢的书籍;2. 每本书只能分配给一个人。通过使用深度优先搜索算法,可以系统地探索所有可能的分配组合,确保每个分配方案都符合上述条件。该方法能够有效地处理这类组合优化问题,找到所有可行的解。 ... [详细]
author-avatar
此号我已不再用
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有